COMPASS: High-Efficiency Deep Image Compression with Arbitrary-scale Spatial Scalability

Jongmin Park, Jooyoung Lee, Munchurl Kim

ICCV 2023


Abstract

Abstract

本研究提出了一种名为COMPASS的新型基于神经网络的空间可扩展图像压缩方法,支持任意尺度的空间可扩展性,通过采用一种称为LIFF的层间任意尺度预测方法,有效减少了相邻层之间的空间冗余,并提供了与单层编码相媲美甚至更好的编码效率。

Background

Abstract

  • 论文背景: 随着多媒体应用的增长,图像压缩变得越来越重要。尽管神经网络(NN)基于图像压缩方法在编码效率方面取得了显著进展,但大多数现有方法仅支持非可扩展图像压缩,而空间可扩展图像压缩的研究相对较少。
  • 过去方案: 传统的可扩展编码方法主要分为质量可扩展编码和空间可扩展编码。现有的NN-based方法主要集中在质量可扩展编码,而空间可扩展编码的研究相对较少。现有的NN-based空间可扩展编码方法中,只有一种固定的尺度因子被使用,限制了其在实际应用中的可行性。
  • 论文的Motivation: 鉴于现有方法的局限性,本研究旨在提出一种新型的NN-based空间可扩展图像压缩方法,名为COMPASS,以支持任意尺度的空间可扩展性,并提高编码效率。

Method

Method

  • a. 理论背景:
    • COMPASS是一种基于神经网络的空间可扩展图像压缩方法,支持任意比例的空间可扩展性。它采用了一种称为LIFF的层间任意比例预测方法,以减少相邻层之间的冗余。实验结果表明,与现有方法相比,COMPASS在BD-rate方面取得了显著的增益,并且在各种比例因子下具有可比或更好的编码效率。
  • b. 技术路线:
    • COMPASS是一种基于神经网络的图像压缩网络,具有任意比例的空间可扩展性。它使用LIFF方法将图像的多个版本编码为单个比特流。它还引入了一个组合的RD损失函数,用于有效训练多个层次。COMPASS相比现有方法显著提高了编码效率,并支持任意比例因子。

Experiment

例子

  • a. 详细的实验设置:
    • 实验使用了不同的比例因子进行了多组实验,包括五组双层可扩展性和五组三层可扩展性。实验中使用的数据集和通道数与前一节中的相同。
  • b. 详细的实验结果:
    • 表1显示了COMPASS在BD-rate方面与其他方法的编码效率性能对比。除了单层(均值比例)方法外,COMPASS优于所有空间可扩展编码方法。与使用相同图像压缩模块的Mei等人的增强版本相比,COMPASS在各种比例因子下实现了-14.23%的BD-rate增益。在参数方面,COMPASS的参数比Mei等人的方法少。与SHVC在不同层次上相比,COMPASS也显示出显著的BD-rate增益。
    • 对于任意比例因子,COMPASS实现了高编码效率。表2显示了双层可扩展编码的比较结果,其中COMPASS优于所有空间可扩展编码方法,甚至与使用均值比例模型的单层编码实现了可比较的结果。对于三层可扩展编码,除了4.0×比例因子外,COMPASS也优于所有空间可扩展编码方法,并展示了对单层编码的优越性。
    • 图6显示了COMPASS与其他方法在相邻层之间比例因子为2的三层可扩展编码的视觉比较结果。COMPASS的重构图像在主观质量方面明显更好,特别是在边缘和纹理等高频成分方面。
    • 通过消融研究验证了COMPASS中所提出元素的有效性。结果表明,完整的COMPASS模型明显优于消融模型,表明每个提出的元素都有助于提高编码效率。